header2.png

Hands-On

Hands-On ini digunakan pada kegiatan Microcredential Associate Data Scientist 2021

Pertemuan 6

Pertemuan 6 (enam) pada Microcredential Associate Data Scientist 2021 menyampaikan materi mengenai Mengumpulkan Data, Menelaah Data dengan metode Visualisasi

Latihan (1)

Sebelum menelaah data dengan metode visualisasi, kita perlu memanggil modul visualisasi (seaborn & matplotlib) terlebih dahulu.

Latihan (2)

Karena kita tidak membutuhkan kolom "Id" dalam melakukan visualisasi kita dapat menghapus kolom "Id" menggunakan fungsi .drop()

Latihan (3)

Lakukan pengecekan nilai yang hilang (missing value) pada dataset. Dengan function info()

Latihan (4)

Tampilkan visualisasi dari data yang telah menggunakan fungsi describe() untuk mendapatkan informasi umum statistik tentang dataset

Latihan (5)

Tampilkan visualisasi bar plot dan pie chart untuk menghitung frekuensi setiap species dalam dataset iris

Latihan (6)

Visualisasi jointplot digunakan untuk menganalisis dua variable dan menggambarkan distribusi pada plot

Tampilkan visualisasi jointplot menggunakan fitur 'SepalLengthCm' dan 'SepalWidthCm' dalam visualisasi jointplot.

Latihan (7)

Latihan (8)

Latihan (9)

Latihan (10)

Latihan (11)

Latihan (12)

Visualisasi Boxplot untuk memberikan ringkasan statis dari fitur yang diplot.

Tampilkan visualisasi boxplot menggunakan kolom "Species" dan "PetalLengthCm" dalam dataset iris

Latihan (13)

Visualisasi Violin Plot untuk memvisualisasikan sebaran data dan distribusi probabilitas.

Tampilkan visualisasi Violin Plot dengan menggunakan setiap kolom yang ada untuk melihat sebaran data terhadap kolom "Species" dalam dataset iris

Latihan (14)

Visualisasi pairplot yang juga dikenal dengan scatterplot adalah visualisasi sebaran data yang menunjukan keterkaitan antar kolom.

Tampilkan visualisasi pairplot dari setiap kolom yang ada untuk melihat sebaran data dalam dataset iris

Latihan (15)

Visualisasi heatmap digunakan untuk mengetahui korelasi setiap kolom dalam dataset. Nilai positif atau negatif yang tinggi menunjukkan bahwa fitur tersebut memiliki korelasi yang tinggi. Hal ini membantu kita memilih parameter untuk machine learning.

Tampilkan visualisasi heatmap dari korelasi setiap fitur dalam dataset iris

Latihan (16)

Visualisasi Distribution plot untuk membandingkan jangkauan dan distribusi untuk dataset numerik. Visualisasi Distribution plot tidak relevan untuk analisis data yang terperinci karena berkaitan dengan ringkasan distribusi data.

Tampilkan visualisasi Distribution plot setiap fitur dalam dataset iris

Latihan (17)

Visualisasi Residual Plot adalah visualisasi untuk memplot residu dengan nilai prediksi pada sumbu x, dan residu pada sumbu y. Jarak dari garis 0 adalah seberapa buruk prediksi untuk nilai yang di plot.

Tampilkan visualisasi Residual Plot dari fitur "SepalLengthCm" dan SepalWidthCm dalam dataset iris

Latihan (18)

Visualisasi Stacked Histogram digunakan untuk menunjukkan bagaimana fitur yang lebih besar dibagi menjadi fitur yang lebih kecil dan menunjukan hubungan masing-masing fitur terhadap jumlah total

Tampilkan visualisasi Stacked Histogram dari fitur "Species" dengan mengubah tipe datanya menjadi category (astype) dalam dataset iris

Latihan (19)

Visualisasi Area Plot memberi kita representasi visual dari Berbagai dimensi dalam dataset.

Tampilkan visualisasi Area Plot dari fitur 'SepalLengthCm','SepalWidthCm','PetalLengthCm','PetalWidthCm' dalam dataset iris

Latihan (20)

Visualisasi distplot membantu untuk melihat distribusi variabel tunggal. Kde menunjukkan kepadatan distribusi

Tampilkan visualisasi distplot dari fitur 'SepalLengthCm' dengan menggunakan Kde (kind) untuk menunjukkan kepadatan distribusi dalam dataset iris